Évaluation des LLM : les arbitrages de Salesforce | Silicon

Clément Bohic - Silicon - 04/07

Salesforce a entrepris un benchmark des LLM sur des cas d'usage CRM. Comment l'a-t-il orchestré et qu'en ressort-il ?

Quelle taille de prompt ? Quel juge pour les évaluations automatisées ? Quelles conditions d’exécution pour les modèles non disponibles sur une API publique ? Autant de questions que Salesforce a dû aborder pour constituer son benchmark de LLM.

Ce benchmark a la particularité de cibler des cas d’usage propres aux CRM. Dans deux domaines en l’occurrence : ventes et service. Ils couvrent la synthèse et la génération de contenus textuels.

Pour le moment, Salesforce n’a évalué que des modèles génériques entraînés pour le suivi d’instructions. Ils émanent de huit fournisseurs :

– AI21 (Jamba-Instruct) – Anthropic (Claude 3 Haiku, Claude 3 Opus) – Cohere (Command R+, Command Text) – Google (Gemini Pro 1.0, Gemini Pro 1.5) – Meta (Llama 3 8B, Llama 3 70B) – Mistral AI (Mistral 7B, Mixtral 8x7B) – OpenAI (GPT-4o, GPT-4 Turbo, GPT-3.5 Turbo) – Salesforce (XGen 2)

À benchma...
[Courte citation de 8% de l'article original]

Tags : llm - salesforce - erp - logiciels -

Source et Copyright images et textes : Clément Bohic - Silicon
Lien original, consulter l'article dans son intégralité ici : https://www.silicon.fr/salesforce-benchmark-llm-crm-480220.html
Lien direct sur notre site : http://newsexplorer.fr/article/19620547/%C3%89valuation-des-LLM---les-arbitrages-de-Salesforce-|-Silicon
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.

Évaluation des LLM : les arbitrages de Salesforce | Silicon

À benchma... [Courte citation de 8% de l'article original]

À benchma...
[Courte citation de 8% de l'article original]